東 俊一 氏の講演一覧
                14:00
            
            
                
                    - 14:15
                
            
        フードデリバリーサービスの動的モデル化と配達員の報酬最適化
                Dynamic Modeling and Reward Optimization of Food Delivery Services
                
            
                14:15
            
            
                
                    - 14:30
                
            
        経路積分に基づく直接方策改善法を用いた多目的強化学習
                Multi-objective Reinforcement Learning by Path Integral Policy Improvement